仿人脑照相科幻影视

汉字AI系列之二十：汉字AI仿人脑照相式阅读无任何上下文长度限制

前主流大语言模型采用 Transformer 架构，其自注意力机制本质上是平方级别（O (n²)）的时间与空间复杂度，处理更长的上下文时，模型参数量必须随上下文扩展，随着所支持的上下文长度的增长，模型的参数及计算体量也会呈平方幅度增长：输入序列每翻一倍，计算量